摘要 虚拟数字人是一种体验性媒介,它凭借扮演各种角色身份的能力,承担起连接个体与场景和提供各类场景体验反馈的功能和任务,帮助人们在体验过程中完成新的学习和社会化过程。本文基于虚拟数字人的体验性属性,探讨它在应用与实践过程中的连接机制与媒介属性,并探讨其所面临的关键问题,以及人际交互机制对人与虚拟数字人交互模式的效应,进而提出二者的全新连接模式,以期对未来虚拟数字人的研究与应用提供理论参考。关键词 虚拟数字人;体验性媒介;连接机制;交互模式
虚拟数字人(Virtual/digital human/avatar)是指具有数字化外形的虚拟人物,通常是为特定内容的对话而训练的人工智能角色,具有一定的形象能力、感知能力、表达能力和娱乐互动能力。在包括人物形象生成、语音生成、动画生成、音视频合成以及交互技术等五大模块的通用系统框架内,目前虚拟数字人主要分为非交互性虚拟数字人与交互性虚拟数字人,其中交互性虚拟数字人又分为真人驱动型与智能驱动型。在市场应用上虚拟数字人主要有身份型与服务型两大类,替代真人服务的虚拟主播和虚拟IP中的虚拟偶像是目前国内市场的热点,特定场景下的多模态助手,如医疗顾问、日常陪伴、购物客服等是国外虚拟数字人发展的重点。虚拟数字人围绕“人”这一关键词,追求外在表现和交互效果的高度拟人化以引发用户的亲切感和沉浸感,在虚拟数字人精细化、场景化和个性化的发展趋势下,虚拟数字人的本质属性,以及人如何与虚拟数字人产生连接亟需理论解释与应用指导。
当下媒介凭借无处不在、无时不在的特性作用于社会现实,塑造出各类行动场域与社会场域,引发了不同社会角色之间社会交往和连接的变革,包括个人与组织、个人与媒介、社会与媒介,这种由媒介引领的变革过程也被称为媒介化(Mediatization)。库尔德利曾提出,对于媒介的研究应该着眼于考察是否有特定的行动场域 ( fields of action) 因为媒介而展开或者关闭,虚拟数字人引起的一系列连接、关系的变化即是虚拟人技术作为新的社会行动场域所构建起的一系列新行为、新群体、新情境与新空间。在媒介化的基础上,虚拟媒介范式进一步提出虚拟性是媒介基本属性,也可能是未来媒介乃至整个社会的终极形态,个体将在融合了物理和数字的虚拟环境中完成连接的迭代与重组,这种虚实融合的未来生态图景被称为元宇宙,虚拟数字人将以不同于当下的身份参与其中,在塑造元宇宙中多用户场景的社会互动上发挥重要作用。本文结合虚拟数字人的应用现状,回归虚拟数字人的媒介属性,探讨虚拟数字人技术在实践过程中面临的关键问题,反思人际交互机制对人与虚拟数字人交互模式的解释效力,进而提出二者新的连接模式,对未来虚拟数字人的研究与应用提供理论参考。“万物皆媒”作为对于未来媒介形态的猜想与希冀,描述了一种人与外界物质,以及自身内在需求相互联通的媒介化社会景象,强调了连接在建构社会组织、社会结构以及社会文化中的基础性作用。就最新的观点来看,元宇宙这一概念可以用来概括媒介化社会的终极图景,它是“继承与融合现在与未来全部数字技术于一体的终极数字媒介”,通过实现现实世界和虚拟世界的全连接,形成更高维度的超现实世界,个体以虚拟形象和数字身份在其中探索更多的实践空间与社交场域。借助互联网技术与扩展现实技术,实现现实世界与虚拟世界的变换、连接与融合。人在进入虚拟世界后,如何与各种事物产生连接,如何体验各类场景并获得反馈,是实现虚实融合前首先需要考虑的问题。结合元宇宙的设想,虚拟数字人极有可能成为用户与虚拟世界连接交互的第一入口,通过与虚拟数字人的交互进行虚拟生产和劳动,最终形成虚拟世界的社会关系和结构。从技术上来看目前虚拟数字人主要包括真人驱动型和计算驱动型。真人驱动型是基于IP设计或真人偶像绘制原画,在进行面部及身体3D建模后,动作捕捉设备或摄像头将基于真人的动作/表情等驱动虚拟数字人,在灵活度、互动效果方面有显著优势。计算驱动型虚拟数字人的语言表达、面部表情、肢体动作等主要是通过深度学习模型进行实时或离线驱动,在渲染后实现最终效果。从类型上来说,虚拟数字人分为服务型虚拟数字人和身份型虚拟数字人。前者包括替代真人进行内容生产和简单交互的特定行业助手(虚拟主播、银行顾问、展览导游等)与更注重陪伴感的多模态通用AI助手(健康助手,虚拟男/女友等),尽管目前陪伴型或者通用型的虚拟数字人助手处于以智能音箱产品形态为主的语音AI助手阶段,但随着XR技术的进步,拥有特定具体形象的AI助手是未来的发展趋势。后者包括各类虚拟IP、虚拟偶像以及未来在虚拟世界中代表个体的虚拟分身。虚拟IP/偶像目前主要以偶像/网红作为核心场景,多渠道投入运营,并且由2D平面形象转向3D立体形象,如国外知名虚拟歌手兼模特Lil Miquela,凭借其高仿真的形象和前卫流行的穿搭,已经在Instagram上拥有超过数百万粉丝,并创造了超千万美元的年收入。分身型虚拟数字人指的是真人在虚拟世界中的化身,提供个人在虚拟世界中的身份,目前主要的应用场景以社交领域为主,包括VR与AR会议、游戏、交友等。身份型虚拟数字人是未来的发展趋势,和服务型虚拟数字人相比,它更有独立人格象征。虚拟数字人凭借扮演各种角色身份的能力,正在承担起连接个体与场景、并提供各类场景体验反馈的功能和任务,指引人们在体验的过程中完成新的学习和社会化过程。例如美国South by South West2021年音乐节,就创建了一个细节丰富的奥斯汀市中心的虚拟场景,用户通过电脑屏幕或者VR头盔进入,可以与另外十万名用户一起借助虚拟数字“身体”在露天影院、屋顶聚会、剧院表演和主题音乐节之间来回穿梭。同样还有更多小型场景的虚拟社交,例如2021年Roomkey举办的社会创业节,40名参与者在虚拟会议室利用虚拟化身进行语言和肢体交流,一定程度上还原了线下会议室的交谈氛围。除了完全虚拟的社交场景,XR技术支持下的虚实混合应用场景也开始兴起。提供虚拟现实应用的平台Surreal和元宇宙虚拟形象制作公司DNABlock合作,创建了一批定制的、超现实的3D虚拟数字人,为5万名用户提供可以配置到任何虚拟或真实环境中的社交体验。虚拟数字人作为人与场景连接和反馈的“向导”,其设计和外表会影响用户对于交互过程中的真实感、在场感、信任感、群体满意度等方面的感知。数字虚拟人的语言表达(声音、说话节奏等)与非语言表达(面部细节、微表情、身体完整性、真实程度、肢体语言与行为姿势等),都有可能影响用户在各类场景中的交互质量。由此,虚拟数字人将成为未来用户虚拟社交与虚拟活动的虚拟媒介。随着虚拟数字人体验性媒介属性的凸显,它将成为人们学习、生活、社交等各类场景中的向导或者助手,既提供连接也提供连接后的实时反馈。体验时代的数字虚拟人作为媒介与认知时代中的媒介最大的不同是,后者属于导向性媒介,前者属于体验性媒介。认知时代人们受到媒介提供的认知框架的影响,通过媒介对社会规则、知识体系的梳理去相对被动地完成一个社会化过程和学习过程。体验时代强调一种反馈学习的过程,个人通过不断地尝试、反馈与优化来完成社会化和学习过程,进而建立社会关系和社会结构。在这个过程中,虚拟数字人可以充当连接人与万物的中介,如何完成“连接”使命,优化人们的体验感是虚拟数字人的开发与应用需要把握的主线。从传播权力归属的层面来看,由虚拟数字人带来的连接,“不同于分割感官以致传播权力外化的模拟媒介技术”,虚拟数字人以“具身的新型主体方式实现了传播权力向个人的回归”,这种对个人的赋权实际上就是对个人主体性的强调,可以说,虚拟数字人的进化逻辑就是在各类场景中不断凸显个人的主动性与主体性。未来虚拟数字人将会进一步作为个体镜像的自我,代表个体本身,在元宇宙中与其他虚拟数字人进行互动,甚至获得亲密关系。技术进步对个人主体性的解放顺应了人类天性中的根本需求,《卫报》主编Keith Stuart认为,对于网络原住民Z世代(出生于1996-2010年)和Alpha世代(出生于2010年后)来说,即使是体验感最强的游戏产品,都必须包含定制(customization)和创造(creation)两个部分,来满足他们自我表达(self- expression)和探索(exploration)的需要。从行业生产的角度来看,目前虚拟数字人的生产标准均以仿真人类为核心目标,试图通过高度拟人化的外观、语言及其它非语音表征提供尽可能自然逼真的交互体验,为用户带来亲切感、关怀感与沉浸感。目前的主流观点认为,当人工智能的外观、行为被设计成类人,并协助完成本应由人类完成的任务时,人们会更倾向于把人类社会的社会规则和社会期望赋予人工智能。与虚拟数字人的交往同样如此,尤其是具有3D立体形象的数字人,皮肤纹理、光影效果、面部五官等越来越接近真人,并且随着Meta Human Creator等虚幻引擎技术的发展,计算机甚至可以在几分钟内创建高保真虚拟人类,且达到极高的真实感。同时借助大数据、人工神经网络、情感计算等技术,虚拟数字人拥有了较为逼真的语言和非语言符号的双重交互形态,目前被赋予了各种社会身份的虚拟人开始活跃在各行各业承担起一部分人类的工作。除了第一人称视角的直接交互之外,还有第三人称视角的间接交互将真人与数字人交流视频化,成为新的内容产品供用户消费。由腾讯新闻等打造运营的超写实风格数字人梅涩甜与黄渤、马东、马龙等娱乐体育界人士拍摄了一系列“元宇宙”主题的短视频,呈现了一种真人和元宇宙空间、数字人和物理空间交叉互动的新型展演,这类虚实结合的展演可能成为接下来视频内容的创作趋势。但是,在虚拟数字人的构建与应用过程中,也浮现了一些需要仔细思考和合理应对的问题与挑战。(一)虚拟数字人的仿真程度与用户接受度:恐怖谷效应虚拟数字人的呈现方式与互动方式直接影响人类对于虚拟数字人的接受程度。根据Mansour等人的研究,虚拟数字人的外观、行为的仿真度是影响社会互动感知的关键因素。Bailenson等人发现人类交往中的亲密行为表现,如身体接触、眼神接触、面部表情(微笑)、语气(温暖)等,在与VR环境下的虚拟数字人的交互中同样能产生亲密感。随着虚拟现实变得越来越“社会化”,虚拟世界中类人主体的视觉表征成为重中之重。虚拟数字人如何尽可能地还原人类的外形特征,以及用户对其外表与行为的接受程度,是业界和学界共同关注的问题。现阶段虚拟数字人的形象结构越来越追究细节的仿真,包括皮肤、肌肉、骨骼、音色等,追求对真人形态与肢体运动的高度还原。但是对于虚拟数字人,尤其是与人类高度相似的3D智能驱动型数字虚拟人,仿真程度也可能带来恐怖谷效应(Uncanny valley)。恐怖谷效应提出,机器人外貌形象的拟人化程度越高,受众对机器人的情感反应越积极,但当机器人与真人的相似程度到达某个临界点时,受众反而会觉得非常不适与反感。然而若机器人与人类相似度不断提高,受众对机器人的情感反应又回复到喜爱的程度。如何避免或者克服恐怖谷效应,是当下虚拟数字人应用面临的现实问题。需要进一步思考的是,虚拟数字人是否应当高度仿真以无限接近人类,对于此,业界和学界都出现了一些不同的观点。Mori从工业设计的角度认为具备中度的类人性和高度亲和力的机器人最能够让人类用户感受到舒适的相处体验,这一观点也指导了几十年来日本机器人的设计方向。另外,用户对机器人外观的期望会受到使用环境的影响,对于家庭护理等高度个性化和互动性的任务,越像人类的机器人越受欢迎。但对于社交性较弱的场景如保安、检查员等,人们反而对机器形态的机器人表现出更大的偏好。用户年龄差异对于人工智能外表的接受程度也有显著影响,有调查发现老年人更喜欢更类人的机器人,而年轻人对更机器化的外观有更大的接受度。Rothstein等人从用户视角解释了对机器人仿真程度的两种理解,一种是机器人在物理特征方面(外观和行为)与人类高度相似(human-likeness),另一种是人们通过将人类的特征和品质投射到机器人身上来进行拟人化(anthropomorphism),在与机器人初次接触时,类人的外观和行为会提高用户对于机器人拟人化程度的感知,但相处经验的增加会引发习惯效应(habituation effect),减少物理特征上的人类相似性对用户感知机器人拟人化的影响。因此包括虚拟数字人在内的人工智能,是否应该在客观特征上高度仿真,需要结合用户特征、使用环境、使用经验等多方面因素来考虑,具体结论还有待进一步思考和实证。(二)人与虚拟数字人的交互机制:来自人类社会社交习惯的映射认知系统理论(cognitive systems theory)认为人类存在两个认知系统,社会认知系统(society cognition system)和物理认知系统(physical cognition system),两个认知系统受到不同脑部神经网络区域的作用。在与人类交往时,我们通常采用一种意图性立场,即通过猜测对方的心理状态来解释对方的行为,认为对方行为的出现源自于其内心的意愿。但是与机械物体进行交互时,我们通常用一个设计的立场来解释物体的表现,比如汽车之所以会动是汽油产生的能量。这两类认知系统通常被认为分别稳定地作用于人与人交互以及人与物交互中,在互动早期阶段采取的认知立场会保持到互动结束。但是人工智能作为具有人类表征的物体,人类在与其交往时到底采用何种认知系统,以及认知立场是保持稳定还是在交互过程中不断变化,都未得到充分解释。大部分关于人机交互的研究认为,人类会无意识地将与人机互动中相同的社交启发式应用于计算机,即只要计算机展示足够的具有人类特质的线索,我们的大脑会将计算机与人划上等号,从而产生社会反应。许多实证研究证实了这一观点,比如Westerman,Tamborini& Bowman发现更像人类的虚拟数字人会得到更有利的评价,被认为更有吸引力,更可信,更有能力。而拟人化水平更高的虚拟人也会给受众带来更高的参与感、社会存在感和交流满意度。但上述结论均来自对于以交互次数为单位的短期人机交互效果的考察,人与计算机或人工智能的日常互动通常是长期地、持久地和个性化地,对短期交互的观察往往忽略了接触时长和互动经验等关键影响因素,其结论有效性受到质疑。人类在不同互动阶段会对虚拟数字人产生不同的认知结果。虚拟数字人呈现出的类人特征(面部表情、声音、情感表达等)之所以会让用户将虚拟数字人自动归入“人类”,并引发社会反应,是因为个体对于类人线索会进行无意识加工,任何与人类有关的线索都有可能引发个体对虚拟人属于真实人类的判断。群体内优势假说认为个人对与所属群体相关的刺激反应更快,因此在初次与虚拟数字人交互时,人类可能对虚拟数字人身上带有的类人特征的线索比其它线索反应更快。这也可以解释为什么人们在不承认人工智能助手等同于人类的前提下仍然与其产生社会性交互。此外,缺乏关于虚拟人的知识或者与虚拟人的接触经验可能是导致我们忽视虚拟人的非社交性线索的另一个因素,不断增加的交流经验会让个体随之更新认知和情感结构,更新对虚拟数字人身份的判断,采取不同于人类社会的互动方式和社会规范与其形成新的关系连接(图1)。由此,加入时间这一变量后,新问题出现了:将人类的社会规范和社交机制一成不变地挪用到人与虚拟数字人的连接中是否合理?三、人类社会社交机制在人与虚拟数字人连接中的适用性考察由此看来,目前真人的确是虚拟数字人应用的进化标杆,人与虚拟数字人的连接也在追求对人与人连接的还原,将人类社会的社交机制挪用至与虚拟数字人的交互中似乎也顺理成章。但是在做到虚拟数字人与真人毫无二致以前,必然经历一个漫长的发展与应用过程,且无论虚拟数字人如何最大程度地接近人类,与人类本身始终存在本质差异,尤其从目前的发展趋势来看,虚拟数字人作为人类沉浸式接触外界信息的体验性媒介,承担着连接用户与外部世界的作用,和人类这一生物体的不可控性相比,可控性更强的虚拟数字人依旧是机械体。因此,人类社会的交往规则在人与虚拟数字人的交往中并非百分百地适配。目前市面上许多虚拟数字人应用开始替代真人,通过与人类的直接交互承担起辅助人类学习、培训、交流等工作。社会行动者心理学范式(CASA)认为只要计算机展示足够多的类人线索,我们的大脑会自动将计算机与人划上等号。同样地,大部分研究认为虚拟数字人拟人化的外观会触发人们的社会脚本(诸如礼貌、互助等),反过来又在互动中诱发人们进一步的认知和情感的社会性反应。但是有学者认为CASA理论出现的前提是人类还未能将人工智能看作区别于人类的独立交流对象,默认人工智能理应无限趋近于人,下意识地将人际交互的方式套用在人机交互上。但随着人们逐渐习惯人工智能的日常陪伴,人机交互不一定全部遵循人际交互所用的社会脚本,反而随着互动的持续会生成属于人机交互的独特脚本。这种打破人类自我中心主义偏见的观点被称为CASA扩展理论(extension of CASA),它更加关注人机交互的发展现状,人与技术互动的持续变化,以及人机交互与人际交互的差异性。在间接交互的应用中,用户虽然没有与虚拟数字人产生直接的交流与互动,但是能感知到虚拟数字人的存在与行为,例如在虚拟会议场景中,虚拟数字人作为会议观众,对用户的社会互动、任务表现以及在场感感知可能都会产生一定影响。他人的存在如何影响个体的任务表现是一个经典的社会心理学问题,研究发现对于简单或者熟悉的任务,他人的在场会促进个体的行为能力或水平,这被称为社会促进效应(social facilitation);但是在完成复杂或者陌生的任务时,他人的在场反而会抑制个体的行为能力和水平,即社会抑制效应(social inhibition)。对于虚拟数字人的存在是否也会引发同样的社会促进或者社会抑制效应,相关实验研究发现,被试在解决复杂的数学问题时,无论是真人、2D虚拟人还是3D虚拟人在场,都会出现社会抑制效应。但是也有研究者并未发现机器人在场的社会促进/抑制效应,据此提出需要用新的视角来看待人机关系,来自社会心理学已有的理论可能并不适用于人机交互。Fox等人进一步从打破虚拟数字人无限类人的乐观幻想出发,认为当下人机交互技术远未成熟到可以还原自然的人际交互状态的地步,甚至未来几年或几十年都可能难以得到实质性的突破,因此亲密人际关系中出现的社会资源交换理论(social exchange)、社会渗透理论(social penetration theory)等都无法在当下与虚拟数字人的交往中得到复现,他们呼吁摒弃人机交互理应趋向于人际交互的前提假设,重新挖掘目前技术水平下人与虚拟数字人交互的独特脚本。与人际交互相比,人与虚拟数字人的交互环境存在更多可能性。从发展趋势来看,目前人与虚拟数字人的交互场景主要分为两大类,一类是真实物理环境下的交互,另一类是虚拟数字环境下的交互。从技术难度来说,真实物理环境下的交互更容易实现,表现为虚拟数字人在现实空间中的可视化,其落地场景也相当丰富,包括传统文娱(影视产品、偶像造星等)、社交、游戏、办公、直播电商、陪伴服务等等。这些场景下的交互主要追求提高实时交互的流畅度,尽可能接近真实人际交互的模态。但随着应用场景的增多以及陪伴时长的增加,当用户已经习惯虚拟数字人这一新的社交伙伴时,二者之间完全可能衍生出新的交互机制和交互模式。它更重要的是,虚拟数字人远非人类某些社会角色的替代品,更重要的任务是带领用户突破物理环境的限制,在虚拟现实、增强现实、混合现实等扩展现实(XR)技术的辅助下实现人类在物理空间和虚拟空间的来回穿梭。对于虚拟数字环境下的交互来说,XR技术将扁平化的社交场景推向高沉浸感(immersion)、高在场感(presence)以及具身化(embodiment)的三维虚拟交互空间,用户能在交互过程中感知到身体中的自我(self- location),身体所有权(body ownership),以及身体的可控性(agency)。具身认知理论认为,身体感知会影响认知和情绪在XR技术中带给用户具身化的感知,赋予了用户比物理世界中的身体形态、身体机能与身体可操纵性更大的自由度,甚至可以体验一些非人类的身体特征,这必然会引发用户认知模式的改变。有研究发现交互场景比交互对象更能影响用户对互动质量的感知,打破了实体机器人比虚拟数字人能引发更多社会反应的常规论断,认为只要用户在交互场景中获得了较高的社会在场感,交流对象的实体或虚拟形态并不会给社交体验带来显著差别。由此,源自真实环境下面对面交互产生的人际交互机制,是否能够解释虚拟或者虚实结合环境下的人与虚拟数字人的交互形态,就有待商榷。人与人之间的社交互动并不总是产出最佳互动模式,社会交换理论认为人类本质上是以自我利益为中心的,并且人类经常对他人或者外部群体持有刻板印象或隐性偏见。随着虚拟数字人仿真的颗粒度越来越细,虚拟数字人有了最大程度还原真实人类形象的可能。类人特征线索越多越真实,越有可能引发人类社会中的群体刻板印象在虚拟数字人身上的复现。在现实社会生活中,人类会自动地将不同的外表线索或者身体特征(面孔、体型、穿着等)与刻板印象相联系,比如年轻女性被认为更有吸引力、老年人被视为弱势群体等。当虚拟数字人的外表呈现出与某些人类特征相似时,有可能启动用户头脑中的刻板印象,进一步影响到个体的认知、态度和行为表现。目前已经发现了性别刻板印象对人机交互的影响,比如女性机器人被认为更好打交道,男性机器人则更有权威性。有关老年人护理机器人的研究认为,赋予护理机器人性别等社会性特征的决定是来自于用户的自主意愿还是技术开发者的利益导向型操作,会造成截然不同的后果,尤其对于有认知功能障碍的用户,极易被后者误导。护理机器人的初衷是对老年人的身体、心理以及生活质量提供无差别的专业帮助,刻板印象线索的出现一方面可能提高用户使用的舒适度,提高护理质量,但另一方面当用户本身的性别认知与机器人的性别特征不一致时,可能会引发不适感。并且从长期影响来看,这些线索可能会鼓励或诱导用户与护理及爱人之间产生情感联系,让机器人在维修与替换时可能对用户造成伤害,更重要的是,护理机器人对刻板印象的强调可能会增加用户对他人的歧视,甚至引发危害性行为。因此,如果性别等社会线索使用得当,可以减少人与虚拟数字人互动中的认知负荷,迅速拉近二者距离,给用户带来更好的互动体验。但随着数字人承担的社会角色越来越丰富,在设计和落地这项技术时过于顺从人类已有的关于性别、外貌、人种等刻板印象,可能会强化社会歧视和偏见,阻碍对刻板印象和偏见的批判性思考,不利于社会的多元化发展。还有学者尖锐地指出,鼓励用户与服务性数字虚拟人建立类似人类社会的人际关系,可能会导致用户将与虚拟数字人的社交脚本反过来运用到真实的人际互动中,进而出现对他人的物化、非人化等错误交往模式。四、人与虚拟数字人新连接模式的探讨:启动期、发展期与成熟期人工智能使用设备接受模型(AIDUA)认为拟人化、享乐动机、社会影响等是用户接受人工智能应用的前因变量。有研究进一步聚焦于AI主播,发现感知形象拟人化、感知新颖性、感知可信度等是观众接收新闻AI主播的重要驱动力。可见在虚拟数字人应用初期,拟人化是影响用户接受度的重要原因,可以减轻用户因不熟悉产生的焦虑和压力,增加其使用意愿。目前对于拟人化概念还没有一个统一的定义,它可能是智能产品对人类外观、行为或者特征有意识的模拟,也可能是来自用户无意识的认知倾向,倾向于将人类特征赋予非人类实体,或者更像人类对人工智能与自身相似性的比较和推断。从产品设计和研究的角度来看,拟人化是智能应用的开发者有意识地将人类的特征赋予非人类,不仅包括外观、声音等外在表征,也包括个性、情绪等内在特征。例如,有研究发现人工智能的共情能力可以调节拟人表征与用户接受度之间的关系,共情能力指人工智能可以正确感知到用户的情绪状态并给予相应的反馈。在拟人特征没有增加用户对人工智能的接受度和信任度时,共情能力的出现会提高用户对该人工智能的接受度和信任度。在与具备任何人类特征线索的虚拟数字人进行初次连接时,人们都会被类人线索引发一种无意识的、自发性的社会反应。社会反应理论(Social response theory),社会在场感理论(social presence theory),以及CASA范式等都是用来解释用户这种社会性反应的理论框架。这些理论框架主要用来探讨以下两个问题:用户如何感知拟人化程度,以及不同拟人化程度如何影响用户的使用意愿、使用行为、信任感等等。尽管有不同的结论,大部分研究结论都认为虚拟数字人的拟人化特征与用户使用意愿成正相关,也有利于与用户建立亲密关系。但是目前相关研究还存在许多问题亟待解决,首先是需要对拟人化的概念有一个清晰界定,以方便后期对拟人化程度的测量;其次是对各类拟人化线索给予同等关注,对视觉表征的研究需要更加细化,包括面部表情、五官等,语言、声音以及个性等线索也还未得到充分讨论,并且还应当考虑不同视觉线索的组合效果。另外,对于拟人化特征可能产生负面效果的原因还缺乏深入探讨,现有理论框架不足以解释各类现象,未来还需要参考更多的理论背景和多种研究方法来进一步剖析拟人化的影响机制,给虚拟数字人的开发和应用提供科学依据。时间变量的加入削弱了拟人化在人与虚拟数字人交互中的主导作用,随着交往的深入,两者的互动时长与用户本人的接触经验都对人们如何看待虚拟数字人产生深刻影响。通常认为,围绕人类的内因和外因都会影响其行为表现,内因(proximal cause)包括个人内在层面的感知、认知和情感,外因(distal cause)指的是个人所处的特定历史情境,外因对于个人社会行为表现的作用由个人通过经验积累不断改变的认知和情感结构来实现。在讨论互联网对人们的影响时常提到的“千禧一代”与“Z世代”,就是对在互联网技术发展不同阶段下成长起来的、具有不同程度互联网接触经验的用户的区别性称谓,两者在消费观念、媒介使用习惯、社交行为等方面都有显著差别。同样地,用户的接触经验(内因)和虚拟数字人的不同技术阶段(外因)都会作用于用户本身的认知和情感结构,引发不同的态度和行为表现。结合当前虚拟数字人的发展水平,当人们认识到虚拟数字人远未能还原真实人类时,就能更清醒地认知到虚拟人的非社会性。随着与虚拟数字人接触时间的增加,其行为的不确定性、模糊性或者与人类的不一致性反而成为一种驱动力,促使人们将虚拟数字人看作一个独立于人类之外的类别,不再将人类社会的社交规范映射至与虚拟数字人的交互过程,可能形成一种新的情感和关系连接。一种思考方向是人类自身发生变化。当人类长期与以计算机为基础的信息系统(computer-based information system)而非人类连接时,可能会与计算机而非人类产生连接纽带,人类群落(human colony)逐渐转变为信息群落(information colony)。信息群落对人类群落的替代很有可能以一种未知的方式改变集体层面的人类社会进化方向,因为人类对其生活伴侣(生物或者机器)的选择会对人的本质性特征产生重大影响。当我们长期面对一个本质非人类的智能对象时,有可能以更技术化而非人性化的方式进行思考,不仅仅是人工智能越来越类人,人也会越来越像人工智能,人类的感性本能很有可能被技术理性压制。由此,人与虚拟数字人的交互必然随着人类自身的转变产生全新的交往模式。另一种方向是虚拟数字人可能进化为“后人类”。在探讨如何避免将性别歧视带入护理机器人时,WeBel等人提出了三种解决办法。一是抹去护理机器人的类人属性,强调其功能和技术属性,引导用户将其看作一个纯粹的技术设备,但类人线索作为增加用户使用意愿的重要前因,必然无法完全抹去。二是中立化其性别,比如中性外观、中性声音、中性行为等,但很难阻止用户因为固有二元思维模式而不将无明显性别特征的人工智能归于男性或女性。三是建立超越二元性别分类的后性别属性,可以根据用户需要不断调整虚拟数字人的性别,并且不仅仅是性别,年龄、种族等各种属性都可以摆脱非此即彼的分类,脱离人类当下生命形式的桎梏,成为在不同社会类别中来回“流动”的“后人类”(post human)。后人类的概念来自于学者Braidotti的设想与希冀,它表示人类、其他生物以及技术的融合,摒弃了人类自我中心主义视角,强调人类生物性和技术物质性的相互依赖,认为未来人类和非人类“都有适应乃至驾驭和控制环境从而避免不确定性威胁的动机和驱力”。当下虚拟数字人技术远未达到“后人类”的水平,这一设想也似乎有些天马行空,但这种关于人类与非人类相互关系的哲学探讨,也可以给人与虚拟数字人未来交往模式的预测提供一定参考。除了与虚拟数字人的交往,用户本身的真实物理自我(physical self)与虚拟数字自我(digitalself)的交互机制也是一个值得探讨的问题。在进入虚拟环境后,用户需要一个虚拟形象来进行自我呈现(self-representation),并以此作为媒介进行社交活动,这种虚拟自我“是人类进入元宇宙的重要载体和媒介的延伸”,也被称为自我的数字孪生(digital twin)。Banks等人描述了真实自我与虚拟自我的四种关系:数字自我即物体(avatar-as-object),仅仅是用户进入虚拟环境的工具,没有任何社会属性;数字自我即真实自我(avatar-as-me),作为“镜中我”表征用户的真实特征和自我意思;数字自我即共生体(avatar-as-symbiote),与用户的真实自我进行身份协商和共建,具体表现为用户试图借助化身实现一个理想自我,比如比真实自我更勇敢、更外向等;数字自我即他者(avatar-as-social other),是存在于虚拟世界的社会行为者,拥有独特的人格,与用户建立真实的社会关系与亲密关系。Ptaetorius等人提出,用户对真实自我与虚拟自我关系的感知受到虚拟自我形象表征的影响。虚拟自我的外在表征会产生普罗透斯效应(Proteus Effect),即用户的态度和行为会受到虚拟自我外在表征的影响。比如当虚拟形象更接近用户认知中的完美形象时(更高或者更苗条)时,用户会在线上社交中表现得更加自信和友好,在群体活动中(游戏)也表现得更加主动与积极,并且这种影响也会延续到线下活动中的用户社交行为。同样地,带有强攻击性线索外观特征的虚拟自我也会让用户在虚拟世界中做出更高水平的攻击和反社会行为。普罗透斯效应产生的原因被解释为用户会将虚拟自我看作真实自我在虚拟场景中的呈现方式,并且将自我感知与虚拟形象的特征联系起来,带入新的身份类别,作为下一步行动的参考,虚拟形象的表征与用户的真实自我越接近,普罗透斯效应就越强。对于当前用户来说,越接近真实自我形象的虚拟自我越有吸引力和亲和力,越容易被看成是在线版的真实自我。正如真实自我并非一个单一的、一成不变的实体,虚拟自我也是一个多元的、不断建构的对象,甚至会反过来影响真实自我的呈现。尽管目前无论是学界探讨还是业界实践,都倾向于认同虚拟自我表征是对真实自我的还原,但虚拟自我并非对真实自我的隐藏和替代,而是一种探索、体验和经历真实自我不同面向的路径。因此虚拟自我绝不仅仅是真实自我的数字化克隆,更是真实自我多面向的开发和拓展。当技术更加成熟,人们在虚拟自我的外在表征上有更多可能性,应用场景带来更高的沉浸感,虚拟自我能够完成更多真实自我难以完成的挑战时,必然难以再用当下真实自我完美主义的视角去解析两者的关系,虚拟自我已然是技术赋权下真实自我脱胎换骨的存在,也是真实自我主体意识不断强化的具象表征。根据《中国虚拟数字人影响力指数报告(2021年度)》,在中国媒体智能化的助力下,虚拟数字人产业开始进入快车道,虚拟数字人将成为人机交互新界面,预计2025年虚拟数字人的“繁衍”速度将超过地球人类的繁衍速度。在腾讯新闻的短片中,数字人梅涩甜和真人在太空环境中的互动交流,就像对未来元宇宙世界中人与虚拟数字人交互的模拟,人超出物理空间的限制,以数字化的方式进入各类虚拟空间,利用数字躯体实现人与各类空间之间的在场式连接。数字虚拟人作为人类沉浸式进入各类空间的“钥匙”与“桥梁”,其体验性媒介的作用不言而喻,是未来人们学习、工作与社交的助手和向导,不仅能连接人与信息、人与人,更能连接人与物、人与空间,甚至人与自己。全球疫情对面对面人际交流的进一步限制,让以虚拟数字人为媒介的交互更有其必要性和重要意义。曾经的纽约市市长候选人安德鲁·杨在2021年6月份发起了一场元宇宙竞选(meta compaign),他的虚拟数字分身Avatar-Young作为主角在虚拟数字人制作公司Zepeto的平台上举办了一场针对Z世代观众的新闻发布会,无论效果如何,都表明虚拟数字世界开始被政界等社会主流所接受并涉猎。智能技术的进步和应用势如破竹,但在智能应用普及之前我们需要回归技术的本质,思考它给人类带来的影响。在理解一项新技术应用时必须抛开当前技术发展水平的桎梏,跳出应用的现象层面,深入挖掘技术以及技术与人的交互方式给予人以及人类社会何种新的可能性和变化,因为技术始终在进步,应用也在不断变化,而人永远是技术的受益者和反馈者。同理,对于媒介技术的发展,重点不是如何理解媒介,而是如何理解使用媒介的人以及人与媒介的实践。对于虚拟数字人,当下必须清醒地认识到它的核心功能与角色本质,仔细考虑人与虚拟数字人关系的理论选择,根据与虚拟数字人交互的实际情况来验证已有理论框架的解释力。一方面可以继续将现有的人际关系理论作为研究人与虚拟数字人关系的一种“图灵测试”,进一步深入研究以期还原虚拟数字人拟人化的最优效果。另一方面随着人与虚拟数字人交往的不断深入,需要反思将人际交互作为二者互动模式评判标准的合理性与适配性,抛开人类自我中心主义视角,挖掘和探索新的交互模式,促进个体心理繁荣与群体和谐交往,最终为整个人类社会带来福祉。
作者:程思琪,北京师范大学心理学部博士后,北京100875;喻国明,北京师范大学新闻传播学院教授,北京100875;杨嘉仪,北京师范大学新闻传播学院博士研究生,北京100875;陈雪娇,北京师范大学新闻传播学院博士研究生,北京100875
原文刊载于《新闻界》杂志2022年第7期,参考文献详见原文